Questão 1

Escolha um estado do sul ou sudeste do Brasil e analise o número de casos de óbitos de alguma doença no ano de 2019, como câncer de mama no estado do Rio de Janeiro. Os dados estão disponíveis em http://tabnet.datasus.gov.br.

  1. Faça um mapa da proporção de óbitos por município.

Para este problema escolhemos um banco de dados que relacionava um banco de dados de óbitos por tuberculose no estado do Rio Grande do Sul em 2019.

NM_MUNICIP prop
MONTE BELO DO SUL 0.0003745
EUGÊNIO DE CASTRO 0.0003574
SANTA CLARA DO SUL 0.0003511
NOVA BRÉSCIA 0.0003141
DERRUBADAS 0.0003135
RIO DOS ÍNDIOS 0.0002765
CAPIVARI DO SUL 0.0002571
RIOZINHO 0.0002309
CHUVISCA 0.0002023
CAIÇARA 0.0001972
  1. Faça um mapa da taxa de mortalidade padronizada por município, um gráfico de dispersão considerando essas taxas e o tamanho da população e um gráfico de densidade das SMRs.
## [1] 2.590255e-05

  1. Calcule o índice de moran para esses dados.
## 
##  Monte-Carlo simulation of Moran I
## 
## data:  df$prop 
## weights: ww  
## number of simulations + 1: 10000 
## 
## statistic = 0.031152, observed rank = 8897, p-value = 0.1103
## alternative hypothesis: greater
  1. Calcule a estimativa bayesiana empírica das taxas, faça um mapa das estimativas.
  1. Calcule o risco relativo utilizando o modelo BYM, utilize o IDH e analfabetismo dos municípios como covariáveis, faça um mapa das estimativas do risco relativo.
## 
## Call:
##    c("inla(formula = MORTES ~ 1 + taxa_anal + IDHM + f(id_area, model = 
##    \"bym\", ", " graph = g), family = \"poisson\", data = df, E = df$E_i, 
##    control.compute = list(dic = TRUE, ", " waic = TRUE), control.predictor 
##    = list(compute = TRUE))" ) 
## Time used:
##     Pre = 0.654, Running = 8.5, Post = 0.693, Total = 9.85 
## Fixed effects:
##               mean    sd 0.025quant 0.5quant 0.975quant   mode kld
## (Intercept) -2.005 2.097     -6.648   -1.816      1.578 -1.445   0
## taxa_anal   -1.218 4.947    -10.529   -1.351      8.850 -1.619   0
## IDHM         2.443 2.552     -1.948    2.220      8.077  1.786   0
## 
## Random effects:
##   Name     Model
##     id_area BYM model
## 
## Model hyperparameters:
##                                              mean      sd 0.025quant 0.5quant
## Precision for id_area (iid component)     1726.38 1685.52     113.09  1228.88
## Precision for id_area (spatial component)    4.70    4.14       1.08     3.47
##                                           0.975quant   mode
## Precision for id_area (iid component)        6145.64 305.88
## Precision for id_area (spatial component)      15.65   2.18
## 
## Expected number of effective parameters(stdev): 18.35(9.71)
## Number of equivalent replicates : 27.03 
## 
## Deviance Information Criterion (DIC) ...............: 515.19
## Deviance Information Criterion (DIC, saturated) ....: 291.48
## Effective number of parameters .....................: 21.50
## 
## Watanabe-Akaike information criterion (WAIC) ...: 516.74
## Effective number of parameters .................: 20.18
## 
## Marginal log-Likelihood:  -178.75 
## Posterior marginals for the linear predictor and
##  the fitted values are computed
  1. Interprete os parâmetros estimados do modelo da letra e.

O parâmetro \(\beta_0\) é a linha de base do risco relativo. Para cada unidade que se aumenta nas variáveis IDH e analfabetismo, há um aumento de \(100\times exp(\beta_i - 1)\%\) no risco relativo, enquanto o efeito aleatório puro é presente em cada uma das áreas e não compartilhado por nenhuma, e o efeito aleatório espacial leva em conta a estrutura espacial do nosso mapa.

  1. Qual a diferença entre as taxas do modelo bayesiano e a taxa de mortalidade padronizada?

A taxa de mortalidade padronizada (SMR) é muito sensível a valores extremos que aparecem em localizações de baixa população, e leva apenas em consideração os valores observados e esperados. Já o modelo bayesiano é mais versátil, podendo contar com efeitos fixos (como as variáveis IDH e Analfabetismo acima) e efeitos aleatórios correspondentes à estrutura espacial subjacente.